home *** CD-ROM | disk | FTP | other *** search
/ ftp.cs.arizona.edu / ftp.cs.arizona.edu.tar / ftp.cs.arizona.edu / icon / newsgrp / group02b.txt / 000066_icon-group-sender_Mon Oct 7 16:25:42 2002.msg < prev    next >
Internet Message Format  |  2003-01-02  |  3KB

  1. Return-Path: <icon-group-sender>
  2. Received: (from root@localhost)
  3.     by baskerville.CS.Arizona.EDU (8.11.1/8.11.1) id g97NPGQ26268
  4.     for icon-group-addresses; Mon, 7 Oct 2002 16:25:16 -0700 (MST)
  5. Message-Id: <200210072325.g97NPGQ26268@baskerville.CS.Arizona.EDU>
  6. Date: Mon, 7 Oct 2002 12:51:48 -0700 (PDT)
  7. From: Mark Kot <kot@amath.washington.edu>
  8. Subject: Re: icon
  9. To: trutkin@physics.clarku.edu
  10. Cc: icon-group@cs.arizona.edu
  11. Errors-To: icon-group-errors@cs.arizona.edu
  12. Status: RO
  13.  
  14. >Date: Mon, 7 Oct 2002 10:56:49 -0400 (EDT)
  15. >From: Taybin Rutkin <trutkin@physics.clarku.edu>
  16. >X-Sender: trutkin@planck.clarku.edu
  17. >To: Mark Kot <kot@hyak.amath.washington.edu>
  18. >cc: icon-group@CS.Arizona.EDU
  19. >Subject: Re: icon
  20. >
  21. >On Sat, 5 Oct 2002, Mark Kot wrote:
  22. >
  23. >> (4)  iconcise
  24. >> 
  25. >>      Iconcise is a program to look for verbose or trite
  26. >>      phrases in my writing
  27. >
  28. >How does this work?  It looks for sentences over and under a certain
  29. >length?
  30.  
  31.  
  32. iconcise is actually based on a handbook of common
  33. verbose phrases that also recommends substitutions.
  34. I haven't posted the program for the simple reason
  35. that I don't want to cross over from ``fair use''
  36. to copyright infringement (since the program, in
  37. effect, implements the book).
  38.  
  39. What makes Icon handy for this program is (a) generators
  40. and (b) nice easy-to-use structures.  Generators allow
  41. one to quickly generate all of the manifestations
  42. of verbose phrases.  Basicly, the program consists of many
  43. lines like
  44.  
  45. every insert(T, "by " || ("itself"|"themselves"), ["alone"])
  46. every insert(T, ("don't"|"didn't") || " pay attention to", ["ignore"])
  47.  
  48. or even longer lines like
  49.  
  50. every insert(T, ("declining"|"decreasing"|"diminishing"|"dwindling") || " " || ("number"|"quantity"), ["decreasingly", 
  51. "few", "fewer and fewer"])
  52.  
  53. that create table elements with the bad phrase as the key and a list of
  54. possible substitutions as the corresponding table elements.
  55.  
  56. The program also creates a set of verbose phrases (SVP):
  57.  
  58. SVP := set()
  59. every insert(SVP, key(T))
  60.  
  61.  
  62. The program generates sentences from the input
  63. (see sentence from senten1 in the Icon library),
  64. creates all of the multiword substrings in each sentence,
  65. and checks whether these substrings are  members in the set.
  66. If the the phrase is in the set it uses the table to make
  67. suggestions. The program proceeds sentence by sentence.
  68.  
  69. It sounds complicated, but it actually exectutes quite
  70. quickly.  Indeed, it seems instantaneous (but that may
  71. say something about the number of verbose phrases in
  72. my writing).  
  73.  
  74.                         Mark
  75.  
  76.  
  77.  
  78. >> (5)  izipf
  79. >> 
  80. >>      Izipf is a suite of programs that I wrote to  ana-
  81. >>      lyze  the  diversity  of  postings  to newsgroups.
  82. >>      Some of the programs  analyze  header  information
  83. >>      from archived newsgroups.  Other programs simulate
  84. >>      the growth and evolution of newsgroups using  sim-
  85. >>      ple stochastic processes.  (The resulting analyses
  86. >>      can be seen in an article, ``Zipf's  law  and  the
  87. >>      diversity  of  biology  newsgroups'', that will be
  88. >>      coming out in the journal Scientometrics early  in
  89. >>      2003).
  90. >
  91. >Is this like the above program, but run on USENET and with a history
  92. >mechanism?
  93. >
  94. >Taybin
  95. >--
  96. >http://www.piratesvsninjas.com
  97. >
  98. >
  99.  
  100.